智能论文笔记

Modeling Nonlinear Dynamics in Continuous Time with Inductive Biases on Decay Rates and/or Frequencies

Tomoharu Iwata , Yoshinobu Kawahara

分类： (统计)机器学习 | 人工智能 | 机器学习

2022-12-26

We propose a neural network-based model for nonlinear dynamics in continuous time that can impose inductive biases on decay rates and/or frequencies. Inductive biases are helpful for training neural networks especially when training data are small. The proposed model is based on the Koopman operator theory, where the decay rate and frequency information is used by restricting the eigenvalues of the Koopman operator that describe linear evolution in a Koopman space. We use neural networks to find an appropriate Koopman space, which are trained by minimizing multi-step forecasting and backcasting errors using irregularly sampled time-series data. Experiments on various time-series datasets demonstrate that the proposed method achieves higher forecasting performance given a single short training sequence than the existing methods.

translated by 谷歌翻译

Stable Invariant Models via Koopman Spectra

Takuya Konishi , Yoshinobu Kawahara

分类：机器学习

2022-07-15

重型模型引起了神经网络现代发展的关注。深度平衡模型（DEQ）代表具有重量趋势的无限深度神经网络，最近的研究表明了这种方法的潜力。需要迭代解决训练中的根发现问题，并建立在模型确定的基础动力学基础上，需要DEQ。在本文中，我们介绍了稳定的不变模型（SIM），这是一种新的深层模型，原理在稳定性下近似DEQ，并将动力学扩展到更一般的动力学，从而收敛到不变的集合（不受固定点的限制）。得出SIMS的关键要素是用Koopman和Perron--Frobenius操作员的光谱表示动力学的代表。该视角大致揭示了用DEQS揭示稳定的动力学，然后衍生了两个SIMS的变体。我们还提出了可以以与前馈模型相同的方式学习的SIMS的实现。我们通过实验说明了SIMS的经验表现，并证明SIMS在几个学习任务中对DEQ实现了比较或出色的表现。

translated by 谷歌翻译

Koopman Q-learning: Offline Reinforcement Learning via Symmetries of Dynamics

Matthias Weissenbacher , Samarth Sinha , Animesh Garg , Yoshinobu Kawahara

分类：机器学习

2021-11-02

离线强化学习利用大型数据集来训练政策而无需与环境进行互动。然后，可以在互动昂贵或危险的现实世界中部署学习的策略。当前算法过于拟合到训练数据集，并且在部署到环境外的分发概括时，因此表现不佳。我们的目标是通过学习Koopman潜在代表来解决这些限制，这使我们能够推断系统的潜在动态的对称性。然后利用后者在训练期间扩展其他静态离线数据集;这构成了一种新颖的数据增强框架，其反映了系统的动态，因此要被解释为对环境空间的探索。为了获得对称，我们采用Koopman理论，其中根据用于系统的测量功能空间的线性操作员表示非线性动力学，因此可以直接推断动力学的对称性。我们为对对称性的对称性的存在和性质提供了新的理论结果，这些控制系统如加强学习设置。此外，我们对我们的方法进行了多种基准脱机强化学习任务和数据集，包括D4RL，MetaWorld和RoboSuite，并通过使用我们的框架来始终如一地改善Q学习方法的最先进。

translated by 谷歌翻译

Reproducing kernel Hilbert C*-module and kernel mean embeddings

Yuka Hashimoto , Isao Ishikawa , Masahiro Ikeda , Fuyuta Komura , Takeshi Katsura , Yoshinobu Kawahara

分类： (统计)机器学习 | 机器学习

2021-01-27

内核方法是机器学习中最流行的技术之一，使用再现内核希尔伯特空间（RKHS）的属性来解决学习任务。在本文中，我们提出了一种新的数据分析框架，与再现内核Hilbert $ C ^ * $ - 模块（rkhm）和rkhm中的内核嵌入（kme）。由于RKHM包含比RKHS或VVRKHS）的更丰富的信息，因此使用RKHM的分析使我们能够捕获和提取诸如功能数据的结构属性。我们向RKHM展示了rkhm理论的分支，以适用于数据分析，包括代表性定理，以及所提出的KME的注射性和普遍性。我们还显示RKHM概括RKHS和VVRKHS。然后，我们提供采用RKHM和提议的KME对数据分析的具体程序。

translated by 谷歌翻译

Non-autoregressive Error Correction for CTC-based ASR with Phone-conditioned Masked LM

Hayato Futami , Hirofumi Inaguma , Sei Ueno , Masato Mimura , Shinsuke Sakai , Tatsuya Kawahara

分类：自然语言处理

2022-09-08

连接派时间分类（CTC）的模型在自动语音识别（ASR）方面具有吸引力，因为它们的非自动性性质。为了利用仅文本数据，语言模型（LM）集成方法（例如重新纠正和浅融合）已被广泛用于CTC。但是，由于需要降低推理速度，因此他们失去了CTC的非自动性性本质。在这项研究中，我们提出了一种使用电话条件的蒙版LM（PC-MLM）的误差校正方法。在提出的方法中，掩盖了来自CTC的贪婪解码输出中的较不自信的单词令牌。然后，PC-MLM预测这些蒙版的单词令牌给定的单词和手机补充了CTC。我们进一步将其扩展到可删除的PC-MLM，以解决插入错误。由于CTC和PC-MLM均为非自动回旋模型，因此该方法可以快速LM集成。在域适应设置中对自发日本（CSJ）和TED-LIUM2语料库进行的实验评估表明，我们所提出的方法在推理速度方面优于重新逆转和浅融合，并且在CSJ上的识别准确性方面。

translated by 谷歌翻译

Distilling the Knowledge of BERT for CTC-based ASR

Hayato Futami , Hirofumi Inaguma , Masato Mimura , Shinsuke Sakai , Tatsuya Kawahara

分类：自然语言处理

2022-09-05

Connectionist时间分类（CTC）的模型很有吸引力，因为它们在自动语音识别（ASR）中的快速推断。语言模型（LM）集成方法（例如浅融合和重新恢复）可以通过利用文本语料库的知识来提高基于CTC的ASR的识别准确性。但是，它们大大减慢了CTC的推论。在这项研究中，我们建议提炼基于CTC的ASR的BERT知识，从而扩展了我们先前针对基于注意的ASR的研究。基于CTC的ASR在训练过程中学习了BERT的知识，并且在测试过程中不使用BERT，从而维持CTC的快速推断。与基于注意力的模型不同，基于CTC的模型做出了框架级预测，因此它们需要与BERT的令牌级预测进行蒸馏。我们建议通过计算最合理的CTC路径来获得比对。对自发日语（CSJ）和TED-LIUM2语料库的实验评估表明，我们的方法改善了基于CTC的ASR的性能，而无需推理速度成本。

translated by 谷歌翻译

BMD-GAN: Bone mineral density estimation using x-ray image decomposition into projections of bone-segmented quantitative computed tomography using hierarchical learning

Yi Gu , Yoshito Otake , Keisuke Uemura , Mazen Soufi , Masaki Takao , Nobuhiko Sugano , Yoshinobu Sato

分类：计算机视觉

2022-07-07

我们提出了一种从普通X射线图像中估算骨矿物质密度（BMD）的方法。双能X射线吸收法（DXA）和定量计算机断层扫描（QCT）在诊断骨质疏松症方面具有很高的精度；但是，这些方式需要特殊的设备和扫描协议。测量X射线图像的BMD提供了机会筛查，这对于早期诊断可能有用。先前直接了解X射线图像和BMD之间关系的方法需要大型训练数据集，以实现高精度，因为X射线图像中的强度很大。因此，我们提出了一种使用QCT训练生成对抗网络（GAN）的方法，并将X射线图像分解为骨分割QCT的投影。提出的分层学习提高了定量分解小区域目标的鲁棒性和准确性。使用拟议的方法对200例骨关节炎评估，我们将其命名为BMD-GAN，在预测和地面真实DXA测量的BMD之间显示出Pearson相关系数为0.888。除了不需要大规模训练数据库外，我们方法的另一个优点是它的扩展性对其他解剖区域，例如椎骨和肋骨。

translated by 谷歌翻译

End-to-end Speech-to-Punctuated-Text Recognition

Jumon Nozaki , Tatsuya Kawahara , Kenkichi Ishizuka , Taiichi Hashimoto

分类：自然语言处理

2022-07-07

常规的自动语音识别系统不会产生标点符号，这对于语音识别结果的可读性很重要。随后的自然语言处理任务（例如机器翻译）也需要它们。标点符号预测模型上有许多作品将标点符号插入语音识别结果中作为后处理。但是，这些研究并未利用声学信息进行标点符号预测，并且直接受语音识别错误的影响。在这项研究中，我们提出了一个端到端模型，该模型将语音作为输入并输出标点的文本。在使用声学信息时，该模型有望在语音识别错误方面可靠地预测标点符号。我们还建议使用辅助损失，以使用中间层和未插入文本的输出来训练模型。通过实验，我们将提出的模型的性能与级联系统的性能进行比较。所提出的模型比级联系统获得更高的标点符号预测准确性，而无需牺牲语音识别错误率。还证明，使用中间输出针对未插入文本的多任务学习有效。此外，与级联系统相比，提出的模型仅具有约1/7的参数。

translated by 谷歌翻译

Grounding in social media: An approach to building a chit-chat dialogue model

Ritvik Choudhary , Daisuke Kawahara

分类：自然语言处理

2022-06-12

建立能够具有丰富人类的对话能力的开放域对话系统是语言产生中的基本挑战之一。但是，即使该领域的最新进展，现有的开放域生成模型也无法捕获和利用外部知识，从而导致对看不见的话语的重复或通用响应。当前关于知识对话生成的工作主要集中于角色融合或搜索基于事实的结构化知识来源（例如Wikipedia）。我们的方法采用了更广泛，更简单的方法，旨在通过在社交媒体上发现的随意互动模仿人类的反应行为来提高系统的原始对话能力。该模型利用联合检索器生成器设置，从Reddit查询一组过滤的评论数据，以充当SEQ2SEQ生成器的附加上下文。对开放域对话数据集的自动和人类评估证明了我们方法的有效性。

translated by 谷歌翻译

Building a Personalized Dialogue System with Prompt-Tuning

Tomohito Kasahara , Daisuke Kawahara , Nguyen Tung , Shengzhe Li , Kenta Shinzato , Toshinori Sato

分类：自然语言处理

2022-06-11

没有一致响应的对话系统并不令人着迷。在这项研究中，我们建立了一个对话系统，可以根据给定的角色设置（角色）响应以带来一致性。考虑到语言模型迅速增加的趋势，我们提出了一种使用迅速调整的方法，该方法在预训练的大规模语言模型上使用了低学习成本。英语和日语中自动和手动评估的结果表明，可以使用比微调更少的计算资源来构建具有更自然和个性化响应的对话系统。

translated by 谷歌翻译